Update: February 24, 2023
The new version of
Termout.org is now online,
so this web site is now obsolete and will soon be dismantled.
|
Lista de candidatos sometidos a examen:
1)
clasificación de texto (*)
(*) Términos presentes en el nuestro glosario de lingüística
Is in goldstandard
Rejected: infrecuente (3)
1
paper corpusSignostxt555 - : Tradicionalmente, la clasificación (o categorización) de textos se ha definido como la asignación de un valor Booleano (verdadero o falso) a cada par 〈d [j ],c [i ]〉 ∈ D × C, donde D es el dominio de los documentos (corpus) y C = {[c1],…,c [|c| ]} es el conjunto de etiquetas (clases) predeterminadas. Si un documento está categorizado solo bajo una etiqueta (categorías no sobrepuestas) o bajo múltiples etiquetas a la vez (categorías sobrepuestas), se le llama un ‘problema de una etiqueta’ o un ‘problema multi-etiqueta’ respectivamente (^[39]Sebastiani, 2002
). El caso más estudiado para resolver problemas de clasificación de texto es el de ‘una etiqueta’ y el enfoque principal es el llamado de Clasificación Binaria (Binary classification, BC ), donde un documento es clasificado, ya sea a la categoría c [i ]o a su complemento
Evaluando al candidato clasificación de texto:
1) etiqueta: 3 (*)
clasificación de texto
Lengua:
Frec: 3
Docs: 1
Nombre propio: / 3 = 0%
Coocurrencias con glosario: 1
Puntaje: 2.000 = (1 + (1+2) / (1+2)));
Rechazado: infrecuente; baja disp.;
No se encontraron referencias bibliográficas sociadas al/ alos término(s)
(Que existan referencias dedicadas a un término es también indicio de
terminologicidad.)